    Active Learning Strategies for Phenotypic Profiling of High-Content Screens

    Abstract High-content screening is a powerful method to discover new drugs and carry out basic biological research. Increasingly, high-content screens have come to rely on supervised machine learning (SML) to perform automatic phenotypic classification as an essential step of the analysis. However, this comes at a cost, namely, the labeled examples required to train the predictive model. Classification performance increases with the number of labeled examples, and because labeling examples demands time from an expert, the training process represents a significant time investment. Active learning strategies attempt to overcome this bottleneck by presenting the most relevant examples to the annotator, thereby achieving high accuracy while minimizing the cost of obtaining labeled data. In this article, we investigate the impact of active learning on single-cell–based phenotype recognition, using data from three large-scale RNA interference high-content screens representing diverse phenotypic profiling problems. We consider several combinations of active learning strategies and popular SML methods. Our results show that active learning significantly reduces the time cost and can be used to reveal the same phenotypic targets identified using SML. We also identify combinations of active learning strategies and SML methods which perform better than others on the phenotypic profiling problems we studied

    Issues in the economic development and utilization of EU funds in a disadvantaged sub-region of the Southern Great Plain Region

    The development period between 2007 and 2013 had a historical significance for Hungary as the funds that were provided by the European Union and were supplemented by the domestic and public sectors naturally offered great possibilities for the country’s sub-statistical regions and regions to inspire their development and innovation. In order to use these funds efficiently it is essential to incorporate the developments into the area’s capabilities, to harmonize them and to increase the role of the sub-statistical regions and regions. This study ranks the sub-regions of the Southern Great Plain Region in terms of their economic characteristics and identifies the most disadvantageous ones. Using as an example a specific sub-region it determines the local effects of EU payments with the application of different statistical methods

    A történetírás két pólusa – a tagmondat szemantikájából kiindulva

    A tanulmány célja egy olyan, a tagmondatok szereplőinek a megkonstruálási módjaiból kiinduló szövegtipológiai elképzelés felvázolása volt, amely hozzájárulhat a történeti tárgyú szövegek nyelvészeti elemzéséhez. A tagmondatban megjelenő szereplők megkonstruálódhatnak szubjektumként, tárgyszerűen, illetve neutrálisan. A tanulmány első felében igyekeztem egy olyan kritériumrendszert kidolgozni, amelynek segítségével az egyes szereplők besorolhatók a három típus valamelyikébe. A szubjektumként, tárgyszerűen, illetve neutrálisan megvalósuló konceptualizálás mellett a történeti tárgyú szövegekben megjelenő szereplők megkonstruálási lehetőségeinek a másik dimenzióját a korábbi kutatásokban már részletesen vizsgált konkrétabsztrakt tengely adja, a szereplők ugyanis megkonstruálódhatnak történelmi személyiségekként és az absztrakció különböző fokán álló absztrakt rendszerekként egyaránt. A konstruálás e két dimenziója jelöli ki azt a „koordinátarendszert”, amelyben a történelem szereplőinek konceptualizációi elhelyezhetők. A tanulmány záró szakaszában bemutattam, hogy a szubjektumokat tartalmazó tagmondatok aránya alapján hogyan rajzolható ki egy olyan kétpólusú szövegtipológiai kontinuum, amelynek a mentén az összes történelemről szóló szöveg elhelyezhető. A tanulmányban bemutatott szövegtipológiai megközelítés, integrálva a korábbi kutatások eredményeivel, megfelelő keretet adhat történeti tárgyú szövegek kvantitatív vizsgálataihoz
